首页技术博客 PHP教程数据库技术前端开发 HTML5 Nginx php论坛

新用户注册 | 会员登录

热门标签 | HotTags

当前位置: 开发笔记 > 数据库 > 正文

面试题|无索引如何删除亿级数据？

作者：2012-随意_544 | 来源：互联网 | 2023-06-14 19:27

一业务需求某业务表a数据量大约4.7亿，单表物理大小为370G，其中某些指定xxid'xxx'值的记录大约2亿。受限于磁盘空间比较紧张，需要对在无索引的情况下删除无效数据。如何优雅的删除呢？存在索引的情况下就比较简单，直接利用索引进行删除，写一个for循环语句每次删除500行，每次判断delete影响的行数可以累加计算删除了多少行，直到删除结果为0行。

一业务需求

某业务表a 数据量大约4.7亿，单表物理大小为370G，其中某些指定xxid='xxx'值的记录大约2亿。受限于磁盘空间比较紧张，需要对在无索引的情况下删除无效数据。如何优雅的删除呢？

二思路

2.1 xxid本身有索引

存在索引的情况下就比较简单，直接利用索引进行删除，写一个for 循环语句每次删除500行，每次判断delete 影响的行数可以累加计算删除了多少行，直到删除结果为0行。

那么问题来了，如果要求不能创建索引怎么处理？

2.2 xxid 字段无索引

因为表占用的空间已经比较大 370G ，再添加索引会更大。因为没有索引，故我们不能直接像方法一那样根据 where xxxid='xxx' 删除数据，那样更慢，可能会引发故障。

我们采取 分而治之 的方式，基于主键把表的数据分段，比如每段1000行-2000行(如果主键id不连续则实际数据量会小于指定分段数据)。然后在这1000行里面删除指定的数据，这样delete的执行效率会比直接依赖 xxxid='xxx' 好很多。

代码如下:

这个脚本可以记录上一次的id，用上一次id 作为 init_id进行删除。第一次使用的时候需要手工初始化/tmp/del_aid.id 比如写入 0 或者符合条件的最小主键 id。

2.3 如何更快速的删除

这个环节就当做思考题吧，可以不考虑从库的延迟。大家有什么好的思路，可以分享一下。

推荐文章

工具|Explain 使用分析

哪些因素会导致慢查询？

-The End-

本公众号长期关注于数据库技术以及性能优化，故障案例分析，数据库运维技术知识分享，个人成长和自我管理等主题，欢迎扫码关注。

面试题|无索引如何删除亿级数据？

以上所述就是小编给大家介绍的《面试题|无索引如何删除亿级数据？》，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对我们的支持！

推荐阅读

数据库
福克斯新闻数据库配置失误导致1300万条敏感记录泄露

由于数据库配置错误，福克斯新闻暴露了一个58GB的未受保护数据库，其中包含约1300万条网络内容管理记录。任何互联网用户都可以访问这些数据，引发了严重的安全风险。 ... [详细]

蜡笔小新 2024-12-22 17:57:10
数据库
无需重启MySQL服务即可生效my.cnf配置文件修改

通常情况下，修改my.cnf配置文件后需要重启MySQL服务才能使新参数生效。然而，通过特定命令可以在不重启服务的情况下实现配置的即时更新。本文将详细介绍如何在线调整MySQL配置，并验证其有效性。 ... [详细]

蜡笔小新 2024-12-21 14:26:22
数据库
分布式架构概览与实践

本文探讨了现代分布式架构的多样性，包括高并发、多活数据中心、容器化、微服务、高可用性和弹性架构等，并介绍了与这些架构相关的重要管理技术，如DevOps、应用监控和自动化运维。文章还深入分析了分布式系统的核心概念、主要用途及类型，同时对比了单体应用与分布式服务化的优缺点。 ... [详细]

蜡笔小新 2024-12-19 15:11:28
数据库
Spring Cloud学习指南：深入理解微服务架构

本文介绍了微服务架构的基本概念及其在Spring Cloud中的实现。讨论了微服务架构的主要优势，如简化开发和维护、快速启动、灵活的技术栈选择以及按需扩展的能力。同时，也探讨了微服务架构面临的挑战，包括较高的运维要求、分布式系统的复杂性、接口调整的成本等问题。最后，文章提出了实施微服务时应遵循的设计原则。 ... [详细]

蜡笔小新 2024-12-19 09:25:36
数据库
大型服务端开发中的常见误区

本文探讨了大型服务端开发过程中常见的几个误区，包括异步任务处理不当、日志同步模式使用、网络操作未设置超时、缓存命中率及响应时间未统计、单一缓存模式、分布式缓存加锁不当以及团队管理上的误区，旨在帮助开发者避免这些常见错误。 ... [详细]

蜡笔小新 2024-12-18 14:19:10
数据库
解析APM：提升用户体验的关键工具

APM（Application Performance Management，应用性能管理）对于提供互联网服务的企业至关重要。本文将深入探讨APM如何帮助识别和解决导致用户流失的技术问题，以及它在提升整体用户体验方面的作用。 ... [详细]

蜡笔小新 2024-12-17 15:08:57
数据库
Java远程教学系统毕业设计：源代码、MySQL数据库及文档

本文介绍了Java语言开发的远程教学系统，包括源代码、MySQL数据库配置以及相关文档，适用于计算机专业的毕业设计。系统支持远程调试，采用B/S架构，适合现代教育需求。 ... [详细]

蜡笔小新 2024-12-17 05:12:29
数据库
全能终端工具推荐：高效、免费、易用

介绍一款备受好评的全能型终端工具——MobaXterm，它不仅功能强大，而且完全免费，适合各类用户使用。 ... [详细]

蜡笔小新 2024-12-16 21:02:15
数据库
精通Spring Cloud：从入门到实践的全面指南

Spring Cloud因其强大的功能和灵活性，被誉为开发分布式系统的‘一站式’解决方案。它不仅简化了分布式系统中的常见模式实现，还被广泛应用于企业级生产环境中。本书内容详实，覆盖了从微服务基础到Spring Cloud的高级应用，适合各层次的开发者。 ... [详细]

蜡笔小新 2024-12-16 16:21:23
数据库
热璞数据库与云宏达成兼容性互认证，共筑数据安全屏障

热璞数据库与云宏信息技术有限公司近期宣布完成产品兼容性互认证，旨在提升数据安全性与稳定性，支持企业数字化转型。 ... [详细]

蜡笔小新 2024-12-16 07:48:28
数据库
优质PHP实训与培训学校推荐

本文精选了几所优秀的PHP实训和培训学校，为希望深入学习PHP编程的学员提供参考。 ... [详细]

蜡笔小新 2024-12-14 19:53:44
数据库
深入解析 Android 值动画实现细节

本文详细介绍了如何在 Android 中使用值动画（ValueAnimator）来动态调整 ImageView 的高度，并探讨了相关的关键属性和方法，包括图片填充后的高度、原始图片高度、动画变化因子以及布局重置等。 ... [详细]

蜡笔小新 2024-12-20 17:58:54
数据库
Linux下NFS客户端配置详解

NFS（Network File System）即网络文件系统，是一种分布式文件系统协议，主要用于Unix和类Unix系统之间的文件共享。本文详细介绍NFS的配置文件/etc/exports和相关服务配置，帮助读者理解如何在Linux环境中配置NFS客户端。 ... [详细]

蜡笔小新 2024-12-18 18:23:35
json
Kubernetes 中 kubectl 的核心命令与操作指南

本文详细介绍了 Kubernetes 集群管理工具 kubectl 的基本使用方法，涵盖了一系列常用的命令及其应用场景，旨在帮助初学者快速掌握 kubectl 的基本操作。 ... [详细]

蜡笔小新 2024-12-18 09:41:33
mysql
2023年最佳PHP开发学习路径推荐

本文详细探讨了针对不同背景的学习者如何选择最适合自己的PHP开发学习资源，包括书籍、在线课程及培训机构的推荐。 ... [详细]

蜡笔小新 2024-12-18 01:56:26

2012-随意_544

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章

PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved |

京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区版权所有